بررسی و بهبود روش های رده بندی در تصاویر ویدئویی به منظور تشخیص مفاهیم معنایی

پایان نامه
چکیده

با رشد روزافزون داده ها (از قبیل متن، صوت و تصویر) نیاز به نمایه گذاری، جستجو، سازمان دهی و دسته بندی خودکار داده ها افزایش یافته است. بیشتر این داده ها، داده های چندرسانه ای، شامل صوت و تصویر هستند. یکی از مهمترین مسائل در سال های اخیر، تشخیص مفاهیم معنایی است. هدف اصلی در تشخیص مفاهیم معنایی تعیین حضور مفهوم معنایی خاصی مانند «خارج ساختمان»، « هواپیما»، »خودرو» و «انسان» در قاب های ویدئویی است. در گذشته، پیشرفت هایی در تشخیص مفاهیم معنایی در دامنه های مختلف گزارش شده است. رده بندی یکی از روش های متداول در حوزه تشخیص مفاهیم معنایی است. در حالیکه بسیاری از رده بندها می توانند برای این منظور استفاده شوند، svm متداول ترین آنهاست. رده بند های svm در مسائل رده بندی پیچیده خوب عمل می کنند. با اینحال، فاز یادگیری آنها مخصوصاً در مواردی که تعداد خصیصه ها زیاد است، فرآیندی زمان بر محسوب می شود. هر خصیصه اضافی، هزینه، حافظه مورد نیاز و زمان سیستم رده بندی را افزایش میدهد. به همین دلیل، محققان پردازش تصویر، تمایل دارند تا برای طراحی و پیاده سازی رده بندها از مجموعه خصیصه های کوچک استفاده کنند. با اینحال، به مجموعه ای مناسب از خصیصه ها برای بدست آوردن نرخ بازشناسی قابل قبول نیاز است. بنابراین، جستجو برای یافتن زیرمجموعه ای بهینه از خصیصه ها از میان مجموعه خصیصه های موجود، دارای اهمیت ویژه ای است. در تشخیص مفاهیم معنایی از طریق رویکردهای یادگیری ماشین، تعداد زیادی از خصیصه ها در کارهای گذشتگان در نظر گرفته می شد. اما، رده بندی بر اساس این تعداد زیاد از خصیصه ها نه تنها زمان رده بندی را افزایش می دهد بلکه می تواند باعث کاهش کارایی سیستم رده بند گردد. بنابراین، انتخاب خصیصه می تواند به عنوان راه حلی مناسب برای کم کردن تعداد خصیصه ها باشد. هدف این پایان نامه، بهبود رفتار رده بند از دیدگاه زمان و کارایی است. در این پایان نامه، قالب کاری جدیدی برای انتخاب مهمترین خصیصه ها از میان خصیصه های سطح پایین، که در رده بند های موجود استفاده می شوند، ارائه می گردد. این کار منجر به کاهش زمان یادگیری و رده بندی توسط خصیصه های انتخاب شده میشود. علاوه بر بهبود زمان رده بند، کارایی رده بند نیز قابل قبول خواهد بود. بدین منظور از الگوریتم ژنتیک برای انتخاب خصیصه استفاده می شود. بعد از انتخاب خصیصه، رده بندهای پایه برای تشخیص وجود مفاهیم معنایی در ویدئو آموزش داده می شوند. به علاوه، از ترکیب برای بهبود کارایی رده بندهای پایه استفاده می شود. در مرحله ترکیب، از خصیصه های انتخاب شده (توسط روش ارائه شده) استفاده می شود و با روش های ترکیب پیشین مقایسه می گردد. نتایج شبیه سازی ها نشان می دهند که با پالایش خصیصه های نا مربوط، معیارهای ارزیابی کارایی رده بند مخصوصا میانگین ظرافت (ap) بهبود می یابند. ظرافت، فراخوانی، دقت، f-score و ویژگی معیارهای کارایی دیگری هستند که در شبیه سازی ها اندازه گیری شده اند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بررسی امکان تشخیص گونه ‏های درختی در تصاویر هوایی رقومی به روش طبقه‏ بندی شی‏ء‏ـ‏ پایه

داده‏های سنجش از دور، به‏ویژه تصاویر هوایی رقومی با توان تفکیک مکانی و رادیومتری زیاد، می‏تواند ابزار مناسبی برای شناسایی گونه‏های درختی باشد. هدف از این تحقیق بررسی قابلیت این تصاویر و روش شی‏ء‏ـ‏پایه برای تشخیص گونه‏های درختی است. به این منظور منطقه‏ای 86/5 هکتاری از پارک طالقانی تهران انتخاب شد. تصاویر دوربین UltraCam-D چهار‏باندی ادغام‏شده با باند پانکروماتیک با پیکسل‏هایی به ‏ابعاد 7×7 سان...

متن کامل

ارائه یک روش ترکیبی به منظور استخراج و ردیابی عوارض متحرک در فریم تصاویر ویدئویی جلونگر مادون قرمز

استخراج و ردیابی عوارض در تصاویر ویدئویی به‌عنوان یک موضوع کلیدی در مباحث بینایی کامپیوتری محسوب می‌گردد، و می‌تواند به‌عنوان چشم‌انداز کارهای سطوح پایین‌تر برای رسیدن به سطوح بالاتر استفاده گردد. در سال‌های اخیر، روش‌های گوناگونی به منظور استخراج و تشخیص عوارض در فریم تصاویر مادون قرمز به‌خصوص در زمینه‌های پایش، نظارت و امنیت پدیده‌ها پیشنهاد شده است. با این وجود، استخراج و ردیابی عوارض متحرک ...

متن کامل

بررسی امکان تشخیص گونه ‏های درختی در تصاویر هوایی رقومی به روش طبقه‏ بندی شی‏ء‏ـ‏ پایه

داده‏های سنجش از دور، به‏ویژه تصاویر هوایی رقومی با توان تفکیک مکانی و رادیومتری زیاد، می‏تواند ابزار مناسبی برای شناسایی گونه‏های درختی باشد. هدف از این تحقیق بررسی قابلیت این تصاویر و روش شی‏ء‏ـ‏پایه برای تشخیص گونه‏های درختی است. به این منظور منطقه‏ای 86/5 هکتاری از پارک طالقانی تهران انتخاب شد. تصاویر دوربین ultracam-d چهار‏باندی ادغام‏شده با باند پانکروماتیک با پیکسل‏هایی به ‏ابعاد 7×7 سان...

متن کامل

ارائه یک روش ترکیبی به منظور استخراج و ردیابی عوارض متحرک در فریم تصاویر ویدئویی جلونگر مادون قرمز

استخراج و ردیابی عوارض در تصاویر ویدئویی به عنوان یک موضوع کلیدی در مباحث بینایی کامپیوتری محسوب می گردد، و می تواند به عنوان چشم انداز کارهای سطوح پایین تر برای رسیدن به سطوح بالاتر استفاده گردد. در سال های اخیر، روش های گوناگونی به منظور استخراج و تشخیص عوارض در فریم تصاویر مادون قرمز به خصوص در زمینه های پایش، نظارت و امنیت پدیده ها پیشنهاد شده است. با این وجود، استخراج و ردیابی عوارض متحرک ...

متن کامل

آنالیز تصاویر چهره به منظور تشخیص خواب آلودگی

تشخیص خواب آلودگی در موارد زیادی از جمله کاهش تصادفات جاده ای اهمیت دارد. در این مقاله، الگوریتم های جدیدی به منظور تعیین مکان مردمک ها و دایره های عنبیه، لب ها و تشخیص وضعیت باز و بسته بودن چشم ها ارائه می شود که در نهایت بر اساس آنالیز چهره (باز و بسته بودن چشم ها و دهان) میزان سطح خواب آلودگی فرد تعیین می شود. در بیشتر روش های مبتنی بر آنالیز چهره با استفاده از یک پارامتر، خواب آلودگی فرد تش...

متن کامل

تحلیل تصاویر ریزآرایه به منظور تشخیص نوع سرطان سینه

Background: Microarray technology is a powerful tool to study and analyze the behavior of thousands of genes simultaneously. Images of microarray have an important role in the detection and treatment of diseases. The aim of this study is to provide an automatic method for the extraction and analysis of microarray images to detect cancerous diseases. Methods: The proposed system consists of t...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023